多模态扩散模型

首页

多模态扩散模型

列表

默认

浏览次数

发布日期

VLOGGER

VLOGGER AI是一款由谷歌研究团队开发的多模态扩散模型，主要用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该工具能够根据音频控制人物动作，包括面部表情、唇部动作、头部运动、眼神、眨眼及上身和手部动作，实现音频驱动的视频合成。VLOGGER生成的视频具有高度的真实性和多样性，能够展示原始主体的不同动作和表情。此外，VLOGGER还可以用于编辑现有视频和跨语言视频内容适配。

AI项目与工具 2024年01月01日 12 点赞 0 评论 782 浏览

多模态扩散模型 首页 多模态扩散模型

列表 默认 浏览次数 发布日期

VLOGGER

多模态扩散模型

首页

多模态扩散模型

列表

默认

浏览次数

发布日期